Entrega Final - Series Cronológicas
Facultad de Ciencias Económicas y Administración - 2025 - UDeLaR
Se dispone de una serie mensual con la cantidad de clientes con deuda vigente en el Banco Santander en el período Diciembre - 2018 a Marzo - 2025.
Una primera visualización de la serie permite identificar una clara tendencia creciente a lo largo del tiempo, especialmente a partir de 2020, con un aumento significativo hacia 2024.
En principio no se logra reconocer un comportamiento estacional evidente o un patrón repetitivo a intervalos fijos en la serie.
La variabilidad parece aumentar ligeramente con el nivel de la serie, lo que podría sugerir la necesidad de aplicar una transformación logarítmica a modo de homogeneizar la Varianza de la serie. El uso de dicha transformación se evaluará más adelante tomando como insumo el comportamiento de los residuos.
1 Análisis Inicial
1.1 Gráfico de la Serie Temporal
1.2 Estadísticas Descriptivas
| Estadística | Valor |
|---|---|
| Min. | 332198 |
| 1st Qu. | 353424 |
| Median | 398162 |
| Mean | 399505 |
| 3rd Qu. | 435553 |
| Max. | 504989 |
2 Identificación del Modelo
2.1 Análisis en el Dominio del Tiempo
2.1.1 Función de Autocorrelación (FAC)
Se observa que la Función de Aucorrelación (FAC) decrece lentamente y de forma persistente, con coeficientes de autocorrelación significativos que se mantienen altos incluso en rezagos grandes y que, por ende, no se comportan de acuerdo al decaimiento exponencial que caracteriza a las series débilmente estacionarias1. Esto es un fuerte indicio de que la serie no es estacionaria.
Además, las autocorrelaciones significativas en rezagos altos sugieren la presencia de una tendencia, detalle claramente observable al inspeccionar el gráfico de la serie.
2.1.2 Función de Autocorrelación Parcial (FACP)
La Función de Aucorrelación Parcial (FACP) muestra un coeficiente significativo en el primer rezago y luego decae rápidamente, no habiendo otro rezago que resulte significativo al nivel de significación usual del 5%.
Esto podría sugerir un componente AR(1) si la serie fuera estacionaria. Sin embargo, dada la FAC planteada anteriormente, se concluye de este primer análisis del Dominio del Tiempo en la necesidad de aplicar, al menos, una primera diferencia regular a la serie.
2.2 Análisis en el Dominio de Frecuencias
Mediante el Periodograma Suavizado de la serie es posible respaldar la idea de que la misma presenta una tendencia que debería ser modelada.
En particular, las frecuencias más próximas a 0, y por ende las asociadas a ciclos de período próximo a infinito (el componente tendencial) explica la mayor parte de la variabilidad de la serie2.
2.3 Serie Diferenciada de acuerdo a la Primera Diferencia Regular
2.4 FAC y FACP de la Serie Diferenciada
{r}
Al analizar la Función de Autocorrelación de la serie de Cantidad de Personas con Deuda en Santander una vez aplicada la primera diferencia regular (\(d=1\)), se observa que, aunque la tendencia lineal ha sido eliminada (lo que se corrobora con los tests de Dickey-Fuller Aumentado y KPSS, CHEQUEAR UNA VEZ DADOS TEST DE RAICES UNITARIAS), persisten patrones de Autocorrelación significativos.
Específicamente, se nota la presencia de coeficientes significativos en el rezago 3, en el rezago 6 y en el rezago 9, con una rápida aproximación a las bandas de confianza3.
De esta manera se puede destacar que las observaciones se encuentran autocorrelacionadas con sus valores de 3, 6 y 9 meses atrás. Dado que estos rezagos son múltiplos de 3 es que se plantea modelar una estacionalidad de tipo trimestral. Para ello se aplicará una Primera Diferencia Estacional asociada al rezago \(k = 3\).
2.5 Serie Diferenciada de acuerdo a la Primera Diferencia Regular y Primera Diferencia Estacional (Trimestral)
2.6 Gráfico de la Serie Diferenciada Estacional
2.7 FAC y FACP de la Serie Diferenciada (Regular y Estacional)
2.8 Serie Diferenciada de acuerdo a la Primera Diferencia Regular y Primera Diferencia Estacional (Anual)
2.9 Gráfico de la Serie Diferenciada Estacional Anual
2.10 FAC y FACP de la Serie Diferenciada (Regular y Estacional Anual)
3 Modelos Propuesto
3.1 Exploración del Modelo ARIMA(3,1,0)
3.1.1 Ajuste del Modelo ARIMA(3,1,0)
| Término | Beta1 | SE |
|---|---|---|
| ar1 | -0.16 | 0.100 |
| ar2 | -0.04 | 0.101 |
| ar3 | 0.48*** | 0.100 |
| Abbreviations: CI = Confidence Interval, SE = Standard Error | ||
| 1 *p<0.05; **p<0.01; ***p<0.001 | ||
3.1.2 Criterios de Información del Modelo ARIMA(3,1,0)
| AIC | AICc | BIC |
|---|---|---|
| 1533.778 | 1534.35 | 1543.048 |
3.1.3 Diagnóstico de los Residuos del Modelo ARIMA(3,1,0)
3.1.3.1 FAC y FACP de los Residuos
3.2 Exploración del Modelo SARIMA(3,1,0)(0,1,0)[12]
Como los FAC y FACP de la serie con primera diferencia regular muestran una relación significativa en el rezago 12, se va a explorar un modelo SARIMA(3,1,0)(0,1,0)[12].
3.2.1 Ajuste del Modelo SARIMA(3,1,0)(0,1,0)[12]
| Término | Beta1 | SE |
|---|---|---|
| ar1 | -0.11 | 0.124 |
| ar2 | 0.00 | 0.125 |
| ar3 | 0.23 | 0.124 |
| Abbreviations: CI = Confidence Interval, SE = Standard Error | ||
| 1 *p<0.05; **p<0.01; ***p<0.001 | ||
3.2.2 Criterios de Información del Modelo SARIMA(3,1,0)(0,1,0)[12]
| AIC | AICc | BIC |
|---|---|---|
| 1300.059 | 1300.749 | 1308.632 |
3.2.3 Medidas de Error del Modelo SARIMA(3,1,0)(0,1,0)[12]
| Conjunto | ME | RMSE | MAE | MPE | MAPE | MASE | ACF1 |
|---|---|---|---|---|---|---|---|
| Training set | 253.8599 | 6250.746 | 4450.923 | 0.0479291 | 1.092867 | 0.1687837 | -0.0300656 |
3.2.4 Pruebas de Raíz Unitaria en los Residuos del SARIMA(3,1,0)(0,1,0)[12]
| Test | Statistic | p_value | Method |
|---|---|---|---|
| ADF Test | -3.3623748 | 0.0681654 | Augmented Dickey-Fuller Test |
| KPSS Test | 0.1450357 | 0.1000000 | KPSS Test for Level Stationarity |
3.2.5 Diagnóstico de los Residuos del Modelo SARIMA(3,1,0)(0,1,0)[12]
3.2.5.1 Gráfico de Residuos
3.2.5.2 FAC y FACP de los Residuos
3.2.5.3 Test de Ljung-Box
| Test | Estadistico | p_value | Metodo | Parametro |
|---|---|---|---|---|
| Ljung-Box (Lag 10) | 2.939612 | 0.8905319 | Box-Ljung test | 7 |
| Ljung-Box (Lag 20) | 24.879731 | 0.0974341 | Box-Ljung test | 17 |
3.2.5.4 Análisis de Homocedasticidad
3.2.5.5 Análisis de Normalidad
3.2.5.6 Tests de Normalidad
| Test | Estadistico | p_value | Metodo |
|---|---|---|---|
| Shapiro-Wilk | 0.9679064 | 0.0511602 | Shapiro-Wilk normality test |
| Jarque-Bera | 5.4385214 | 0.0659235 | Jarque Bera Test |
3.3 Exploración del Modelo SARIMA(0,1,0)(3,1,0)[3] con Componente Estacional Trimestral AR(3)
Dado que se observaron picos en los meses de marzo, junio, septiembre y diciembre en el gráfico estacional, lo que sugiere una estacionalidad trimestral, exploraremos un modelo SARIMA que incorpore esta periodicidad. Específicamente, se propone un modelo SARIMA(0,1,0)(3,1,0)[3], que aplica una diferencia regular (d=1) y una diferencia estacional trimestral (D=1, período=3), además de incluir un componente autorregresivo estacional de orden 3 (P=3) para capturar la dependencia en los rezagos trimestrales.
3.3.1 Ajuste del Modelo SARIMA(0,1,0)(3,1,0)[3]
| Término | Beta1 | SE |
|---|---|---|
| sar1 | -0.67*** | 0.111 |
| sar2 | -0.51*** | 0.128 |
| sar3 | -0.39*** | 0.118 |
| Abbreviations: CI = Confidence Interval, SE = Standard Error | ||
| 1 *p<0.05; **p<0.01; ***p<0.001 | ||
3.3.2 Criterios de Información del Modelo SARIMA(0,1,0)(3,1,0)[3]
| AIC | AICc | BIC |
|---|---|---|
| 1465.897 | 1466.494 | 1475.003 |
3.3.3 Medidas de Error del Modelo SARIMA(0,1,0)(3,1,0)[3]
| Conjunto | ME | RMSE | MAE | MPE | MAPE | MASE | ACF1 |
|---|---|---|---|---|---|---|---|
| Training set | 247.7342 | 5768.175 | 4139.837 | 0.0494375 | 1.038639 | 0.156987 | -0.2086285 |
3.3.4 Pruebas de Raíz Unitaria en los Residuos del SARIMA(0,1,0)(3,1,0)[3]
| Test | Statistic | p_value | Method |
|---|---|---|---|
| ADF Test | -3.5471007 | 0.0437844 | Augmented Dickey-Fuller Test |
| KPSS Test | 0.0982678 | 0.1000000 | KPSS Test for Level Stationarity |
3.3.5 Diagnóstico de los Residuos del Modelo SARIMA(0,1,0)(3,1,0)[3]
3.3.5.1 Gráfico de Residuos
3.3.5.2 FAC y FACP de los Residuos
3.3.5.3 Test de Ljung-Box
| Test | Estadistico | p_value | Metodo | Parametro |
|---|---|---|---|---|
| Ljung-Box (Lag 10) | 5.169803 | 0.6392500 | Box-Ljung test | 7 |
| Ljung-Box (Lag 20) | 18.045584 | 0.3859706 | Box-Ljung test | 17 |
3.3.5.4 Análisis de Homocedasticidad
3.3.5.5 Análisis de Normalidad
3.3.5.6 Tests de Normalidad
| Test | Estadistico | p_value | Metodo |
|---|---|---|---|
| Shapiro-Wilk | 0.9613234 | 0.0206083 | Shapiro-Wilk normality test |
| Jarque-Bera | 7.3869629 | 0.0248852 | Jarque Bera Test |
3.4 Exploración del Modelo SARIMA(3,1,0)(3,1,0)[3] con Componentes Normales y Estacionales Trimestrales
Basándonos en la posible relevancia de los componentes no estacionales y la fuerte evidencia de estacionalidad trimestral, se propone explorar un modelo SARIMA más completo: el SARIMA(3,1,0)(3,1,0)[3]. Este modelo incorpora una diferencia regular (d=1) para la tendencia, un componente autorregresivo no estacional de orden 3 (p=3), una diferencia estacional trimestral (D=1, período=3) y un componente autorregresivo estacional de orden 3 (P=3).
3.4.1 Ajuste del Modelo SARIMA(3,1,0)(3,1,0)[3]
| Término | Beta1 | SE |
|---|---|---|
| ar1 | -0.24* | 0.122 |
| ar2 | -0.10 | 0.127 |
| ar3 | -0.16 | 0.288 |
| sar1 | -0.53 | 0.284 |
| sar2 | -0.40* | 0.165 |
| sar3 | -0.31* | 0.139 |
| Abbreviations: CI = Confidence Interval, SE = Standard Error | ||
| 1 *p<0.05; **p<0.01; ***p<0.001 | ||
3.4.2 Criterios de Información del Modelo SARIMA(3,1,0)(3,1,0)[3]
| AIC | AICc | BIC |
|---|---|---|
| 1468.075 | 1469.825 | 1484.011 |
3.4.3 Medidas de Error del Modelo SARIMA(3,1,0)(3,1,0)[3]
| Conjunto | ME | RMSE | MAE | MPE | MAPE | MASE | ACF1 |
|---|---|---|---|---|---|---|---|
| Training set | 374.1794 | 5631.726 | 4070.608 | 0.0763067 | 1.012419 | 0.1543617 | -0.0068667 |
3.4.4 Pruebas de Raíz Unitaria en los Residuos del SARIMA(3,1,0)(3,1,0)[3]
| Test | Statistic | p_value | Method |
|---|---|---|---|
| ADF Test | -3.3307532 | 0.0732656 | Augmented Dickey-Fuller Test |
| KPSS Test | 0.1209984 | 0.1000000 | KPSS Test for Level Stationarity |
3.4.5 Diagnóstico de los Residuos del Modelo SARIMA(3,1,0)(3,1,0)[3]
3.4.5.1 Gráfico de Residuos
3.4.5.2 FAC y FACP de los Residuos
3.4.5.3 Test de Ljung-Box
| Test | Estadistico | p_value | Metodo | Parametro |
|---|---|---|---|---|
| Ljung-Box (Lag 10) | 2.564114 | 0.9221923 | Box-Ljung test | 7 |
| Ljung-Box (Lag 20) | 13.293879 | 0.7163012 | Box-Ljung test | 17 |
3.4.5.4 Análisis de Homocedasticidad
3.4.5.5 Análisis de Normalidad
3.4.5.6 Tests de Normalidad
| Test | Estadistico | p_value | Metodo |
|---|---|---|---|
| Shapiro-Wilk | 0.967282 | 0.0468881 | Shapiro-Wilk normality test |
| Jarque-Bera | 5.313698 | 0.0701690 | Jarque Bera Test |
3.5 Comparación de Modelos SARIMA
Footnotes
En el presente trabajo se utilizará como sinónimos “estacionariedad en sentido débil”, “estacionariedad en covarianza” y “estacionariedad”, al igual que se hizo durante el desarrollo del curso.↩︎
Corresponde resaltar, sin embargo, que la relación entre el área que se encuentra por debajo del Espectro/Periodograma y la Varianza de la serie se plantea para series estacionarias, propiedad que claramente no caracteriza a la serie en tratamiento.↩︎
El coeficiente asociado al rezago 12 también es significativo, aunque como su magnitud es mayor a la del coeficiente del rezago 9 se decide, en principio, trabajar con los rezagos \(k = 3, 6, 9\). Si bien 12 es múltiplo de 3 y por ende su significación puede estar ligada a la trimestralidad, no se debe descartar que pueda existir un componente de estacionalidad anual.↩︎